Text copied to clipboard!

Título

Text copied to clipboard!

Ingeniero de Confiabilidad del Sitio

Descripción

Text copied to clipboard!
Estamos buscando un Ingeniero de Confiabilidad del Sitio (SRE) altamente calificado para unirse a nuestro equipo de tecnología. Este rol es fundamental para garantizar la disponibilidad, escalabilidad y eficiencia de nuestros sistemas de producción. El candidato ideal tendrá una sólida experiencia en operaciones de sistemas, desarrollo de software y automatización de procesos, con un enfoque en la mejora continua y la resolución proactiva de problemas. Como Ingeniero de Confiabilidad del Sitio, trabajarás en estrecha colaboración con equipos de desarrollo, operaciones y seguridad para diseñar, implementar y mantener infraestructuras resilientes. Serás responsable de monitorear el rendimiento del sistema, responder a incidentes críticos, y desarrollar herramientas que mejoren la confiabilidad y la eficiencia operativa. Además, participarás en revisiones post-mortem para identificar causas raíz y prevenir futuras interrupciones. Tus responsabilidades incluirán la creación de sistemas de monitoreo y alertas, la automatización de tareas repetitivas, la implementación de prácticas de CI/CD, y la gestión de la capacidad y el rendimiento. También colaborarás en la definición de acuerdos de nivel de servicio (SLA), objetivos de nivel de servicio (SLO) y errores de nivel de servicio (SLE), asegurando que los sistemas cumplan con los estándares de calidad y disponibilidad requeridos. Buscamos a alguien con una mentalidad orientada a la ingeniería, que disfrute resolver problemas complejos y que tenga pasión por la confiabilidad del software. Este rol requiere habilidades técnicas avanzadas, pensamiento analítico y una fuerte capacidad de comunicación para trabajar en un entorno colaborativo y de alta exigencia. Si te apasiona construir sistemas robustos, automatizar procesos y mejorar continuamente la infraestructura tecnológica, esta es una excelente oportunidad para ti.

Responsabilidades

Text copied to clipboard!
  • Diseñar e implementar sistemas de monitoreo y alertas.
  • Automatizar tareas operativas repetitivas.
  • Responder a incidentes críticos y realizar análisis post-mortem.
  • Colaborar con equipos de desarrollo para mejorar la confiabilidad del software.
  • Gestionar la capacidad y el rendimiento de los sistemas.
  • Desarrollar herramientas internas para mejorar la eficiencia operativa.
  • Implementar y mantener pipelines de CI/CD.
  • Definir y monitorear SLA, SLO y SLE.
  • Participar en revisiones de arquitectura y diseño de sistemas.
  • Promover una cultura de mejora continua y confiabilidad.

Requisitos

Text copied to clipboard!
  • Título universitario en Ingeniería Informática, Sistemas o campo relacionado.
  • Experiencia previa como SRE, DevOps o Ingeniero de Sistemas.
  • Conocimiento avanzado de sistemas Linux/Unix.
  • Experiencia con herramientas de monitoreo como Prometheus, Grafana o similares.
  • Habilidad para programar en lenguajes como Python, Go o Bash.
  • Familiaridad con contenedores y orquestadores como Docker y Kubernetes.
  • Experiencia con sistemas de control de versiones como Git.
  • Conocimiento de redes, protocolos y seguridad informática.
  • Capacidad para trabajar en entornos de alta disponibilidad.
  • Excelentes habilidades de comunicación y trabajo en equipo.

Posibles preguntas de la entrevista

Text copied to clipboard!
  • ¿Cuánta experiencia tienes trabajando como SRE o en un rol similar?
  • ¿Qué herramientas de monitoreo has utilizado anteriormente?
  • ¿Has trabajado con Kubernetes o Docker? Describe tu experiencia.
  • ¿Cómo manejas un incidente crítico en producción?
  • ¿Qué estrategias utilizas para mejorar la confiabilidad de un sistema?
  • ¿Tienes experiencia automatizando tareas operativas? ¿Con qué herramientas?
  • ¿Cómo defines y monitoreas los SLA/SLO/SLE?
  • ¿Qué lenguajes de programación dominas?
  • ¿Has participado en revisiones post-mortem? ¿Qué aprendiste?
  • ¿Qué importancia le das a la documentación en tu trabajo?